Automatic Question Categorization: a New Approach for Text Elaboration Categorización automática de preguntas: un nuevo enfoque para elaboración de textos

نویسندگان

  • Marcelo Adriano Amancio
  • Magali Sanches Duran
  • Sandra Maria Aluisio
چکیده

Text adaptation is a normal activity of teachers to facilitate reading comprehension of specific contents; the general approaches for it are Text Simplification and Text Elaboration (TE). TE aims at clarifying, explaining information and making connections explicit in texts. In this paper, we present a new approach for TE: an automatic question categorization system which assigns wh-question labels to verbal arguments in a sentence. For example, in “Mary danced yesterday.” “Who?” is the label linking the verb “danced” to the argument “Mary” and “When?” links “danced” to the argument “yesterday”. This annotation is similar to semantic role labeling, approached successfully via statistical language processing techniques. Specifically, we present experiments to build the system using a fine-grained question set in Portuguese language and address two key research questions: (1) Which machine-learning algorithm presents the best results? (2) Which problems this task presents and how to overcome them?

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Clasificación semántica de textos no estructurados mediante un enfoque evolutivo

Resumen. En la actualidad, cerca del 90% de la información se encuentra plasmada tanto en documentos estructurados como no estructurados. Esto ha dado impulso a la investigación e implementación de diferentes algoritmos para el análisis y clasificación de textos de acuerdo a su orientación semántica. Por ello, en el presente trabajo se describe una manera de clasificación de textos no estructur...

متن کامل

Poblado automático de ontologías de perfiles académicos a partir de textos en español

Resumen. Este artículo propone un enfoque para el poblado automático de ontologías de perfiles académicos a partir de los textos, expedientes curriculares y resúmenes, de publicaciones científicas en español. El enfoque utiliza reglas semánticas y marcadores lingüísticos para extraer los individuos de clase, relaciones y valores de propiedad. Una evaluación ha sido realizada con un conjunto de ...

متن کامل

Codificación (s, c)-Densa: optimizando la compresión de texto en lenguaje natural

Resumen Este trabajo presenta un nuevo método para la compresión de textos, que permite la búsqueda directa de palabras y frases dentro del texto sin necesidad de descomprimirlo. Este método es directamente comparable, en tasa de compresión, con las técnicas basadas en Huffman orientadas a palabras y proporciona una compresión más simple y rápida, manteniendo sus caracteŕısticas más destacables...

متن کامل

Simplificación automática de textos en euskera

En este art́ıculo presentamos el trabajo llevado a cabo dentro del proyecto de tesis doctoral llamado “Egitura sintaktiko konplexuen identifikazioa eta sinplifikazioa euskararen tratamendu automatikoan” (Identificación y simplificación de las estructuras sintácticas complejas en el procesamiento automático del Euskera) que se realiza bajo la dirección de las doctoras Arantza Dı́az de Ilarraza y M...

متن کامل

Desarrollo de un compresor de textos orientado a palabras basado en PPM

Resumen Reducir el espacio de almacenamiento y el tiempo de transferencia se ha vuelto un aspecto fundamental en las Bases de Datos Textuales. En este trabajo se presenta un nuevo compresor, denominado PPM orientado a palabras (SWPPM), en el que se aplican los modelos estad́ısticos propios de PPM utilizando como śımbolos de entrada las palabras. Presenta varios desaf́ıos técnicos para los que es ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2011